查看原文
其他

三门问题与贝叶斯公式

微光探索 微光探索
2024-09-20

文 | 微光

图 | 来源于网络

公众号 | 微光探索

ID | WeLightX

 

上篇文章《卡片笔记写作法与flomo》中,提到过贝叶斯公式。贝叶斯公式是基于所观察到的新信息对预估概率进行修正的方法。有名的“三门问题”,符合初始估计、观察到新信息、根据新信息进行修正的逻辑,是否可以用贝叶斯公式来分析呢?答案是可以,但三门问题其实不是一个典型的贝叶斯问题,一不留神,就会掉入陷阱。今天一起来聊聊这个有意思的话题。

 




一、三门问题


三门问题,又称为蒙提霍尔问题(Monty Hall problem),大致出自美国的电视游戏节目Let's Make a Deal,问题名字来自该节目的主持人蒙提·霍尔。


游戏节目是这样的:参赛者会看见三扇关闭的门,其中一扇后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各有一只山羊。当参赛者选定了一扇门,但还未开启它时,知道答案的节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。然后主持人会问参赛者,要不要换另一扇仍然关上的门。



问题是:换另一扇门是否会增加参赛者赢得汽车的概率?换与不换,赢得汽车的概率分别是多少?


闭上眼睛,思考10秒钟。你脑海中的第一直觉反应,可能是以下答案之一:

  • 不会。换门与不换门,赢汽车的概率都是1/3

  • 不会。换门与不换门,赢汽车的概率都是1/2

  • 会。不换门,赢汽车的概率是1/3;换门,赢汽车的概率是1/2


先说正确答案:会。不换门,赢汽车的概率是1/3;换门,赢汽车的概率是2/3


是不是有点反直觉?别急,下面分别用直观解释法、常规概率分析法及贝叶斯公式法三种方法,一一进行介绍。





二、直观解释法


先来看看三个第一反应的答案,有哪些问题。


选门,就像考试,只不过这道题你压根儿不会,完全靠蒙。主持人开启门,就像考试后老师公布答案。很显然,不管老师是否公布答案、什么时候公布答案,都不会影响你之前的考试成绩。


否则,我们岂不是只需要每次在考试之后,让老师划掉两个错误答案,就能轻松降低挂科概率。当然是白日做梦。


所以,如果不换门,主持人开不开门、开启哪扇门,都不会影响你最初的选择概率。不换门,赢得汽车的概率是1/3


如果换门呢?换门之时,本身已经是一个二选一问题。即使不考虑前面步骤的附加信息,至少已经有保底50%的赢率。换门,自然是胜算更大,赢面增加。


但换门后赢的概率为什么不是50%呢?


1. 反过来想


芒格说:要反过来想。这个问题,其实不难,也只要反过来想,就可迎刃而解。一句话就可以讲清楚。


如果参赛者换门,那么参赛者会在最初选择是错误的时候赢得汽车,概率为2/3;如果参赛者不换门,那么参赛者会在最初选择是正确的时候赢得汽车,概率是1/3。


是不是感觉豁然开朗。


如果没想明白,我们可以把基数变大来理解。上述问题,实际上是主持人帮你排除掉一部分错误答案,帮助你提高选中概率。


设想另外一个游戏。假设如果有100扇门,只有1扇门后有车,你选择1扇门后,主持人为你打开98扇有羊的门,这时你会换吗?


一开始就选对的概率只有1%,选错的概率是99%。然而,好心的主持人帮你排除了98个错误答案。


这时,你有两种选择。不换,意味着你依然相信自己最初的选择;换,意味着你相信自己最初选错了,并且这时更换的目标是唯一的。


你是相信自己最初的判断呢,还是相信知道答案的主持人告诉你的、只有唯一更换方案的、赤裸裸的暗示呢?


主持人只能帮你到这了。必须换,傻子才不换。换门后,你赢车的概率将提高到99%


三门问题,和这个道理一模一样,只不过基数太小没有那么直观罢了。


▍2. 整体分析


还有一种理解,就是用全概率法对所有结果进行整体分析,也只需一句话就可讲清楚。


因为最后只剩两扇门,最终的结果只有两种,不换选中(即换后不中)与换后选中(即不换不中),不换意味着与主持人的开门没关系,不换选中的概率为1/3,那么换后选中的概率自然就是1-1/3=2/3。


就这么简单。





三、常规概率分析法


如果想不到以上直观解释,也可以用常规的概率法来计算。


不换门,概率为1/3,前文已经说明过。下面分析换门后成功的概率。


参赛者的初始选择,有三种可能:山羊一、山羊二和汽车,概率均为1/3


来看换门后的结果:

  • 参赛者挑选山羊一,主持人只能挑山羊二,换门将赢得汽车,概率为1/3

  • 参赛者挑选山羊二,主持人只能挑山羊一,换门将赢得汽车,概率为1/3

  • 参赛者挑选汽车,主持人随机挑选山羊一,换门将失败,概率为1/3×1/2=1/6

  • 参赛者挑选汽车,主持人随机挑选山羊二,换门将失败,概率为1/3×1/2=1/6


可见,换门后成功的概率为1/3+1/3=2/3





四、贝叶斯公式法


贝叶斯公式用来描述两个条件概率之间的关系,P(A|B) = P(B|A)*P(A)/P(B)。可根据概率的乘法法则,P(A∩B) = P(A)*P(B|A) = P(B)*P(A|B),通过简单变形得出。其中,P(A)为A发生的概率,P(A|B)为已知B发生后A发生的概率。


三门问题看上去是一个典型的贝叶斯问题:初始估计、观察到新信息、根据新信息进行修正。但实际上如果用贝叶斯公式来分析三门问题,稍不留神就会误入陷阱。


假设参赛者一定会换门,则我们可将三门问题转化为一个不放回抽样问题:测试者初始选择为第一次抽样,主持人打开门为第二次抽样,参赛者换门为第三次抽样。


但需要注意的是,主持人开门对应的第二次抽样不是一个随机抽样的概率事件,是知道答案后人为选取确定会发生的事件,而其随机抽取的理论概率却并不是100%


受到人为干预因素影响后,如果事件实际发生的概率不等于理论发生的概率,这样的事件便不能作为贝叶斯公式中的基本概率事件,否则会使结果出错。这也是三门问题有很多错误分析并引起强烈争议的原因。


使用贝叶斯公式的前提,是选取的事件A和事件B都是概率事件。当然这并非指不能选取概率为1的事件,而是指不能选取通过人为干预使实际概率与理论概率不同的事件作为概率事件。


第二次开门,如果是随机抽样,选取到山羊的理论概率只有2/3,但由于主持人知道答案并刻意选择,实际选取到山羊的概率是1


如果我们误把第二次抽样为山羊作为B事件,第三次抽样为汽车作为A事件,来求P(A|B),无论取P(B)的概率为1还是2/3,按贝叶斯公式计算都会得到错误的结果,因为人为干预使得事件B不再是真正的概率事件,并且会影响第三次抽样结果。


比如取P(B)=1,会错误地得出P(A|B) = P(B|A)*P(A)/P(B) = 1×1/3/1=1/3的结论;取P(B)=2/3,会错误地得出P(A|B) = P(B|A)*P(A)/P(B) = 1×1/3/(2/3)=1/2的结论。


三门问题,其实不是一个典型的应用贝叶斯公式求条件概率的问题。


如果一定要用贝叶斯公式来分析是否可以呢?可以,但需要做一些调整。方法是把主持人开门设置为整个过程中一个可以确定发生的步骤,而不是作为一个概率事件。


事件A和事件B可设定如下:

  • 事件A为:第一次抽样为山羊;

  • 事件B为:第三次抽样为汽车。


时间A完成后,我们将“从剩下两扇门中去掉一只山羊”变为一个固定步骤,然后再执行事件B。换门后能赢得汽车的概率问题,变为求事件B的概率P(B)


这里最终求的不是条件概率,需要使用贝叶斯公式的变形版本:P(B) = P(B|A)*P(A)/ P(A|B)。


P(A) = P(第一次抽样为山羊) = 2/3


在第一次抽样为山羊发生的前提下,由于主持人确定会再去掉一只山羊,于是第三次抽样为汽车的概率为100%,即 P(B|A) = P(第三次抽样为汽车|第一次抽样为山羊) = 1


而第三次抽样为汽车发生的前提下,剩下两个门只能都是山羊,于是第一次抽样为山羊的概率也为100%,即 P(A|B) = P(第一次抽样为山羊|第三次抽样为汽车) = 1


于是,根据贝叶斯公式,P(B) = P(第三次抽样为汽车) = P(B|A)*P(A) / P(A|B) = 1×2/3/1=2/3


不要只随便套用贝叶斯公式,要仔细思考其背后逻辑。





五、钱袋摸金币问题


关于典型的贝叶斯问题,可以来看看钱袋摸金币问题


有三个外观相同的钱袋子b1b2b3,其中b1里有两枚金币,b2有一金一银,b3有两枚银币。请问:随机取一个钱袋,第一次摸出一枚金币的概率是多少?如果第一次是金币,剩下那枚还是金币的概率是多少?



直觉也许是这样的:“第一枚摸到的是金币,说明一定不是b3,三个袋子中取两个,概率是2/3;既然第一枚已经是金币了,说明只能是钱袋b1b2其中一个,两个袋子无差别,所以剩下那枚还是金币的概率是50%


这是一个典型的条件概率问题,可用贝叶斯公式来求解。


先来假设几个概率事件:

  • 事件A:第一枚是金币;

  • 事件B:第一枚是金币,第二枚也是金币;

  • 事件B1:摸到的钱袋是b1

  • 事件B2:摸到的钱袋是b2

  • 事件B3:摸到的钱袋是b3


第一个问题,第一次摸出一枚金币的概率是多少?也就是求事件A的概率P(A)


易知,P(B1)=P(B2)=P(B3)=1/3


事件A的概率可由全概率公式计算 P(A) = P(A|B1)*P(B1) + P(A|B2)*P(B2) + P(A|B3)*P(B3)P(A|B1)表示“当B1已发生时A发生的概率,即摸到的钱袋是B1后,摸到的第一枚是金币的概率”。易知P(A|B1)=1P(A|B2)=1/2P(A|B3)=0


于是,P(A) = 1*1/3+1/2*1/3+0*1/3=1/2


事实上,对于第一次摸到金币的概率,可以从整体角度来考虑。袋子是随机挑选的,币也是随机摸的,把金币、银币放到袋子里摸,和把所有币混合到一起摸,概率是一样的。金币、银币各占一半,所以第一次摸到金币的概率是50%


第二个问题,剩下那枚还是金币意味着两枚都是金币,是事件B的概率,也等同于事件B1的概率;如果第一枚是金币,代表事件A已经发生;于是第二个问题等价于求P(B|A)P(B1|A)


P(A)=1/2P(B1)=1/3P(A|B1)=1。根据贝叶斯公式,P(B|A) = P(B1|A) = P(A|B1)*P(B1) / P(A) = 1*1/3/(1/2) = 2/3


值得一提的是,如果将事件B仅仅定义为第二枚是金币,看上去也合理,但是却没法用于问题求解。因为单纯只判断第一次或第二次,概率上其实没有区别,P(A)P(B)本质上是一回事,P(A|B)P(B|A)同样也是相等的,导致无法通过贝叶斯公式求解问题。


而把事件B定义为连续两次摸出金币,将事件B的范围扩大,就与A事件建立了联系,同时也不与题意矛盾,这样便可计算P(A|B),并通过P(A|B)求出P(B|A)


那最初的直觉错在哪呢?问题在于,虽然b1b2袋子是一样的,但b1是两枚金币,满足事件A的概率是b2的两倍,因此事件B概率的分子、分母中,都占有两倍权重。


概率是很多问题的基础,但很多时候直觉并不能告诉我们正确答案。


芒格说,应该相信概率而不是运气。当概率不站在我一边的时候,我从来不玩。多了解一点概率知识,对我们的工作、生活、投资都会有所帮助。投资是概率问题,没有100%确定的事情,我们要做的,就是不断评估和比较,让大概率站在我们一边。






继续滑动看下一个
微光探索
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存